LLMs – ein Spezialfall neuronaler Netze
LLMs sind neuronale Netze, die auf Text spezialisiert sind.
Die Lernaufgabe beim Training ist denkbar einfach: Sag das nächste Wort vorher. Trainiert auf Milliarden von Seiten Text reicht das aus, um ein Modell zu erzeugen, das schreibt, erklärt, übersetzt und Code produziert.
Ein LLM-Aufruf ist probabilistisch: Ausgehend vom bisherigen Text (dem Kontext) liefert das Modell eine Wahrscheinlichkeitsverteilung über mögliche nächste Tokens (Wörter oder Wortfragmente). Das wahrscheinlichste wird gewählt – dann wiederholt sich der Vorgang.
Kontext: "def berechne_querschnitt(radius:"
P(" float") = 0.73, P(" int") = 0.12, P(" str") = 0.01, ...
→ wähle " float" → neuer Kontext → nächstes Wort → ...